ارائه‌ی الگوریتمی به‌منظور خوشه‌بندی صفحات وب براساس محتوا و لینک

Authors

  • امیرمحسن کریمی‌مجد دانشکده‌ی مهندسی صنایع، دانشگاه علم و صنعت ایران
  • محمد فتحیان دانشکده‌ی مهندسی صنایع، دانشگاه علم و صنعت ایران
Abstract:

وجود یک موتور جست‌وجوی کارا می‌تواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جست‌وجو، انتخاب مناسب‌ترین صفحات در مواجهه با پرسش‌های چندوجهی کاربران است. «خوشه‌بندی صفحات براساس محتوا و لینک» رویکردی است که برای حل چنین مسائلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتم‌های موجود، به‌نام C‌o‌h‌s‌M‌i‌x، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخ‌ها و افزایش سرعت حل بهبود داده شده است. تعیین نقطه‌ی شروع مناسب، استفاده از خواص شبکه‌های پیچیده به‌منظور ساده‌سازی محاسبات، و محاسبه‌ی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان می‌دهد که الگوریتم بهبودیافته، کیفیت جواب‌ها را ارتقا داده و باعث افزایش سرعت حل می‌شود. همچنین، به‌عنوان مطالعه‌ی موردی، داده‌های مربوط به وبلاگ‌های فارسی استخراج و الگوریتم بهبودیافته روی این داده‌ها اجرا خواهد شد.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

وب سنجیِ صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ

Background and Aim: Considering the potential damages caused by inaccurate, inadequate and incomplete information published in web pages, the aim of this study was to evaluate Persian-language web pages containing nutritional information, using Silberg criteria. Materials and Methods: Internet pages related to nutrition were found in “peyvandha.ir” and by searching 20 nutrition-related keywo...

full text

وب سنجیِ صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ

زمینه و هدف: با توجه به صدمات بالقوه­ی ناشی از اطلاعات نادرست و ناکافی در صفحات وب، هدف این مطالعه، ارزیابی و تعیین وضعیت صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ می­باشد. روش بررسی: صفحات وب مرتبط با تغذیه با استفاده از ۵ موتور جستجوگر و صفحه پیوندها، و با استفاده از ۲۰ کلیدواژه مرتبط با تغذیه پیدا شدند. 50 نتیجه اول جستجوی هر کلیدواژه در هر موتور جستجو در صورت مطابقت با معیارهای ورود...

full text

ارزیابی سایتهای وب بازیابی شده توسط دو راهنمای شبکه وب (ODP و YAHOO) در حوزه علوم کتابداری و اطلاع‌رسانی براساس معیارهای محتوا و کارایی

در این پژوهش، ابتدا یک سیاهه وارسی جامع در دو دسته معیار کلی محتوا و کارایی شامل 42 شاخص در زیرگروههای صحت، اعتبار، جدید بودن، کیفیت نوشته، کاربرپسندی، قابلیت جستجو و قابلیت مرور، براساس سیاهه‌های وارسی در دسترس، تدوین گردیده  و سپس کیفیت محتوا و کارایی سایتهای وب بازیابی شده در حوزه علوم کتابداری و اطلاع‌رسانی در چهار مقوله بازیابی اطلاعات، مدیریت دانش، راهنماها و مراکز تحقیقاتی در دو ...

full text

تکوین معیارهای زیبایی‌شناسی صفحات وب ایران

چکیده بررسی زیبایی در محیط تعاملی وب به‌معنای توجه به مخاطب به‌مثابه‌ی دریافت‌کننده‌ای منفعل نیست بلکه به معنی نیاز به روشی برخط است تا بتوان مخاطب را در فرایند طراحی وارد نمود. هدف از پژوهش، پیشنهاد روشی برای اخذ بازخورد مخاطب و تحلیل نتایج به‌منظور دست‌یافتن به معیارهای زیبایی‌شناسی مخاطب‌محور است. روش تحقیق، توصیفی-تحلیلی، همراه مطالعات کتابخانه‌ای، پژوهش میدانی و مصاحبه است. جهت تحلیل داده...

full text

ارائه رویکردی به منظور شناسایی و پیش بینی وب‌سایتهای فیشینگ به وسیله الگوریتمهای کلاس‌بندی براساس مشخصه‌های صفحات وب

امروزه مهمترین ریسک و چالش مورد توجه در تجارت و بانکدارای الکترونیک، خطر کلاهبرداری آنلاین و حملات فیشینگ است. حملات فیشینگ همواره به عنوان یکی از ابزارهای پرکاربرد برای مهاجمان، به منظور سرقت کلمه­های عبور و رمزهای الکترونیک کاربران در مبادلات الکترونیک بوده است. در این نوع کلاهبرداری، مهاجمان نامه­های الکترونیک با ادعاهای مختلف به قربانی ارسال می­کند و با تکنیکهای مختلفی قربانی را به صفحه­های...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 33.1  issue 1.1

pages  21- 28

publication date 2017-08-23

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023